热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

基因组浏览器中的Wig格式解析

本文详细介绍了Wiggle(Wig)格式及其在基因组浏览器中的应用,涵盖variableStep和fixedStep两种主要格式的特点、适用场景及具体使用方法。同时,还提供了关于数据值和自定义参数的补充信息。

Wiggle(简称 Wig)是一种用于绘制基因组上图形轨迹的文件格式,适用于显示密集且连续的数据,如GC含量、概率分数和转录组数据等。Wig 格式包括两种主要类型:variableStep 和 fixedStep。下面我们将详细介绍这两种格式,并探讨其在基因组浏览器中的应用。

一、VariableStep 格式

VariableStep 格式适用于不规则间隔的数据点,特别适合于全基因组数据集。它允许在指定的染色体片段区域内绘制条形图,但区域大小必须恒定(由 span 参数指定)。如果数据点之间的间隔过于极端,此格式在编码和显示时效率较低,建议使用 BedGraph 格式。UCSC 不推荐将 VariableStep 作为基因组浏览器输入文件,因为 BigWig 格式更为高效。

1. 特点及适用场景

  • 用于绘制条形图,适用于全基因组数据集。
  • 数据点间具有不规则间隔,但在某些情况下需要谨慎使用。
  • 如果数据点间距过大,建议使用 BedGraph 格式。
  • UCSC 推荐使用 BigWig 文件以提高效率。

2. 格式说明

声明行以单词 variableStep 开头,后跟染色体规范。数据行包含两列,分别是染色体位置和数据值。

variableStep chrom=chrN [span=windowSize]
chromStartA dataValueA
chromStartB dataValueB
...

3. 示例

以下示例表示在2号染色体上的300701-300705位置均显示12.5:

variableStep chrom=chr2
300701 12.5
300702 12.5
300703 12.5
300704 12.5
300705 12.5

可选的 span 参数(默认为1)允许更简洁地指定连续相同数据值的碱基范围。例如,应用 span=5 后:

variableStep chrom=chr2 span=5
300701 12.5

当每1,024个碱基只有几个数据点时,VariableStep 格式会变得效率极低。若数据点相距超过约100个碱基,则建议使用 BedGraph 格式。

二、FixedStep 格式

FixedStep 格式适用于有规律间隔的数据点,特别适合全基因组数据集。它在指定的染色体片段区域内绘制条形图,要求区域大小恒定(由 span 参数指定),且染色体位置精确地按固定步长(由 step 参数指定)排列。

1. 特点及适用场景

  • 适用于绘制条形图,特别适合全基因组数据集。
  • 染色体位置按固定步长间隔排列。

2. 格式说明

声明行以单词 fixedStep 开头,包含染色体、起始坐标和步长规范。数据行仅包含一列数据值。

fixedStep chrom=chrN start=position step=stepInterval [span=windowSize]
dataValue1
dataValue2
...

3. 示例

以下示例表示3号染色体上的三个区域(每个区域5个碱基):400601-400605、400701-400705 和 400801-400805,分别显示值11、22和33:

fixedStep chrom=chr3 start=400601 step=100 span=5
11
22
33

对于 VariableStep 和 FixedStep 格式,必须在整个数据集中使用相同的跨度和步长。未指定时,默认跨度为1,步长也为1。

三、数据值

Wiggle 格式的数据值可以是整数、实数、正值或负值,但不支持 NaN 值。未指定的位置不会显示数据。

需要注意的是,wiggle 文件的染色体坐标从1开始,而对于 bigwig 文件则从0开始。

四、自定义 wiggle 轨迹的参数

可以通过设置多个参数来自定义 wiggle 轨迹的显示效果。以下是常用的参数及其默认值:

track type=wiggle_0 name=track_label description=center_label visibility=display_mode color=r,g,b altColor=r,g,b priority=priority autoScale=on|off alwaysZero=on|off gridDefault=on|off maxHeightPixels=max:default:min graphType=bar|points viewLimits=lower:upper yLineMark=real-value yLineOnOff=on|off windowingFunction=mean+whiskers|maximum|mean|minimum smoothingWindow=off|2-16

其他参数:

autoScale                                      # default is on
alwaysZero # default is off
gridDefault # default is off
maxHeightPixels # default is 128:128:11
graphType # default is bar
viewLimits # default is range found in data
viewLimitsMax # suggested bounds of viewLimits, but not enforced
yLineMark # default is 0.0
yLineOnOff # default is off
windowingFunction # default is maximum, mean+whiskers is recommended
smoothingWindow # default is off
transformFunc # default is NONE

示例

1. 下面是一个包含 VariableStep 和 FixedStep 格式的 Wig 文件示例:

browser position chr19:49304200-49310700
browser hide all
# 150 base wide bar graph at arbitrarily spaced positions,
# threshold line drawn at y=11.76
# autoScale off viewing range set to [0:25]
# priority = 10 positions this as the first graph
# Note, one-relative coordinate system in use for this format
track type=wiggle_0 name="variableStep" description="variableStep format" visibility=full autoScale=off viewLimits=0.0:25.0 color=50,150,255 yLineMark=11.76 yLineOnOff=on priority=10
variableStep chrom=chr19 span=150
49304701 10.0
49304901 12.5
49305401 15.0
49305601 17.5
49305901 20.0
49306081 17.5
49306301 15.0
49306691 12.5
49307871 10.0
# 200 base wide points graph at every 300 bases, 50 pixel high graph
# autoScale off and viewing range set to [0:1000]
# priority = 20 positions this as the second graph
# Note, one-relative coordinate system in use for this format
track type=wiggle_0 name="fixedStep" description="fixedStep format" visibility=full autoScale=off viewLimits=0:1000 color=0,200,100 maxHeightPixels=100:50:20 graphType=points priority=20
fixedStep chrom=chr19 start=49307401 step=300 span=200
1000900800700600500400300200100

2. 在基因组浏览器中,选择菜单栏 My DataCustom Tracks 选项。

3. 将上述代码粘贴到输入框,点击 Submit 按钮。

4. 简要信息显示后,点击 Go 进行绘制。

5. 最终得到绘制好的轨迹图。


推荐阅读
author-avatar
鬼鬼太子_157
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有